#wasserstein reinforcement learning

Formulación Wasserstein del Aprendizaje por Refuerzo. Una Perspectiva de Transporte Óptimo sobre la Optimización de Políticas

Optimiza tu aprendizaje por refuerzo con la formulación de Wasserstein desde una perspectiva de transporte óptimo en la optimización de políticas.